|
Metody vyhledávání tandemových repetic v DNA sekvencích
Havlík, Kryštof ; Sedlář, Karel (oponent) ; Maděránková, Denisa (vedoucí práce)
V této práci je objasněna základní problematika repetitivní DNA a jsou zde zhodnoceny vyhledávače tandemových repetic bezplatně dostupné široké veřejnosti. V praktické části práce je popsán algoritmus sloužící k vyhledávání tandemových repetic založený na převodu sekvence DNA do číselného formátu. Následuje zpracování vzniklého signálu pomocí krátkodobé Fourierovy transformace, vytvoření spektrogramu, jehož analýza slouží k nalezení pozice a obsahu repetitivních oblastí. Výsledkem práce je porovnání výstupů vybraných volně dostupných programů s vytvořeným programem a zhodnocení výhod a nevýhod.
|
| |
|
Detection of repetitive sequences in genomes
Puterová, Janka ; Jedlička, Pavel (oponent) ; Kléma, Jiří (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Repetitive sequences can make up a significant part of the genome, in some cases more than 80%, but scientists have often overlooked them. Today we know that repeats have various functions in the genomes and are divided into two main groups: interspersed and tandem repeats. This work aimed to develop bioinformatics tools to detect repetitive sequences, either directly from sequencing data generated by sequencers or assembled genomes. In the introductory part, the work provides an insight into the issue and an overview of the repeat types occurring in genomes. Furthermore, the work deals with existing approaches and tools with an aim to detect repeats directly from the assembled sequences. The main contribution to this area was developing the digIS tool, which aims to detect insertion sequences that represent the most abundant interspersed repeats in prokaryotes. digIS is based on the principle of profile hidden Markov models constructed for the catalytic domains of transposases, representing the most conserved part of the insertion sequences and retaining a secondary structure within the family. Subsequently, the work provides an overview of sequencing technologies and discusses existing methods for detecting repeats directly from sequencing data without the need for prior genome assembly. A novel approach for a detailed analysis of tandem repeats is presented. This approach extends the primary analysis of RepeatExplorer, which detects and characterizes repeats directly from sequencing data. The work further discusses the applications of repeat detection in biological research, especially from the point of view of comparative repeatome studies and the evolution of sex chromosomes. Finally, the work summarizes the research results in the form of four articles published in international journals, the full text of which is available in the appendices, and provides a general summary of the work together with possibilities for future research.
|
| |
|
Vyhledáváni repetitivní DNA z nukleotidových sekvencí
Moskovská, Kateřina ; Provazník, Ivo (oponent) ; Kubicová, Vladimíra (vedoucí práce)
V této práci je rozebrána problematika repetitivních DNA a algoritmů pro vyhledávání tandemových repetic. Tandemové repetice hrají důležitou roli v biologickém průmyslu. Slouží jako genetické markery pro tvoření genetických map, profilů DNA pro určování otcovství a ve forenzní oblasti. Dalším důvodem pro jejich vyhledávání je, že mají za následek několik závažných onemocnění člověka. Algoritmy pro jejich vyhledávání jsou proto předmětem mnoha studií. Algoritmy dělíme do dvou hlavních skupin – algoritmy porovnávající řetězce DNA a algoritmy založené na zpracování numericky reprezentované DNA. Úkolem této bakalářské práce je vybrat si zástupce z každé skupiny, navrhnout jejich realizaci a tu poté také předvést v programovém prostředí Matlab. Výsledkem práce by mělo být porovnání obou programů na základě vybraných kritérií s pomocí několika sekvencí. Těchto několik vybraných sekvencí budou mít za úkol tyto programy zpracovat a výsledky z těchto zpracování budou mezi sebou porovnány.
|
|
Detection of repetitive sequences in genomes
Puterová, Janka ; Jedlička, Pavel (oponent) ; Kléma, Jiří (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Repetitive sequences can make up a significant part of the genome, in some cases more than 80%, but scientists have often overlooked them. Today we know that repeats have various functions in the genomes and are divided into two main groups: interspersed and tandem repeats. This work aimed to develop bioinformatics tools to detect repetitive sequences, either directly from sequencing data generated by sequencers or assembled genomes. In the introductory part, the work provides an insight into the issue and an overview of the repeat types occurring in genomes. Furthermore, the work deals with existing approaches and tools with an aim to detect repeats directly from the assembled sequences. The main contribution to this area was developing the digIS tool, which aims to detect insertion sequences that represent the most abundant interspersed repeats in prokaryotes. digIS is based on the principle of profile hidden Markov models constructed for the catalytic domains of transposases, representing the most conserved part of the insertion sequences and retaining a secondary structure within the family. Subsequently, the work provides an overview of sequencing technologies and discusses existing methods for detecting repeats directly from sequencing data without the need for prior genome assembly. A novel approach for a detailed analysis of tandem repeats is presented. This approach extends the primary analysis of RepeatExplorer, which detects and characterizes repeats directly from sequencing data. The work further discusses the applications of repeat detection in biological research, especially from the point of view of comparative repeatome studies and the evolution of sex chromosomes. Finally, the work summarizes the research results in the form of four articles published in international journals, the full text of which is available in the appendices, and provides a general summary of the work together with possibilities for future research.
|
|
Metody vyhledávání tandemových repetic v DNA sekvencích
Havlík, Kryštof ; Sedlář, Karel (oponent) ; Maděránková, Denisa (vedoucí práce)
V této práci je objasněna základní problematika repetitivní DNA a jsou zde zhodnoceny vyhledávače tandemových repetic bezplatně dostupné široké veřejnosti. V praktické části práce je popsán algoritmus sloužící k vyhledávání tandemových repetic založený na převodu sekvence DNA do číselného formátu. Následuje zpracování vzniklého signálu pomocí krátkodobé Fourierovy transformace, vytvoření spektrogramu, jehož analýza slouží k nalezení pozice a obsahu repetitivních oblastí. Výsledkem práce je porovnání výstupů vybraných volně dostupných programů s vytvořeným programem a zhodnocení výhod a nevýhod.
|
| |
| |
|
Vyhledáváni repetitivní DNA z nukleotidových sekvencí
Moskovská, Kateřina ; Provazník, Ivo (oponent) ; Kubicová, Vladimíra (vedoucí práce)
V této práci je rozebrána problematika repetitivních DNA a algoritmů pro vyhledávání tandemových repetic. Tandemové repetice hrají důležitou roli v biologickém průmyslu. Slouží jako genetické markery pro tvoření genetických map, profilů DNA pro určování otcovství a ve forenzní oblasti. Dalším důvodem pro jejich vyhledávání je, že mají za následek několik závažných onemocnění člověka. Algoritmy pro jejich vyhledávání jsou proto předmětem mnoha studií. Algoritmy dělíme do dvou hlavních skupin – algoritmy porovnávající řetězce DNA a algoritmy založené na zpracování numericky reprezentované DNA. Úkolem této bakalářské práce je vybrat si zástupce z každé skupiny, navrhnout jejich realizaci a tu poté také předvést v programovém prostředí Matlab. Výsledkem práce by mělo být porovnání obou programů na základě vybraných kritérií s pomocí několika sekvencí. Těchto několik vybraných sekvencí budou mít za úkol tyto programy zpracovat a výsledky z těchto zpracování budou mezi sebou porovnány.
|